過去一年,AI的敘事幾乎都圍繞在「模型變得更聰明」。但真正的轉折點,其實不在模型,而在介面。
最新一代Codex的變化,本質上不是一次升級,而是一次「角色轉換」——它不再只是生成程式碼的工具,而是可以在桌面環境中直接操作應用程式的代理系統。
點擊、輸入、切換視窗、整理資料、甚至在背景同時運行多個任務。
這意味著一個關鍵改變:
AI第一次不需要API,就能「使用軟體」。
這件事的破壞力,遠比模型能力提升更深。
因為過去十年整個軟體產業的基本假設是只要沒有API,就無法被自動化。
但...筆者透過 AIMochi 筆記工具,整理多方公開資訊和最新報導內容,來看看現在這條邏輯正在被直接跳過。
如果回顧Codex的演進,它的路線可以這麼來看:
起初:命令列工具(輸入提示 → 生成程式碼)
中期:開發者輔助工具(IDE整合)
現在:桌面級代理(跨應用操作整個系統)
這不是「功能變多」,而是層級變高。
它不再停留在「程式世界」,而是進入「作業系統世界」。
這裡有一個關鍵技術轉折點:AI開始模擬「人類使用電腦」
不是呼叫API,而是:
看螢幕
判斷UI狀態
移動滑鼠
點擊按鈕
跨應用操作
這讓AI第一次能處理一個長期被忽略的領域:
企業內部那些「沒有API的軟體世界」
例如:
舊ERP系統
內部儀表板
傳統CRM
財務工具
行政系統
這些系統過去無法被自動化,如今卻變成AI最容易切入的地方。
這場變化不只是技術升級,更是兩種AI哲學的碰撞。
1️⃣ OpenAI:直接控制「電腦本身」
OpenAI的方向很明確:
讓AI成為操作系統層級的行動者
核心邏輯是:
不依賴API
不等待整合
直接操作UI
用「通用行為能力」覆蓋所有軟體
等於說,只要你能看到螢幕,就能被AI操作。
這是一種「平台內化」策略。
2️⃣ Anthropic:走向「結構化協作生態」
Anthropic則選擇另一條路:
MCP伺服器
插件系統
結構化介面
明確權限模型
它假設未來軟體會:
主動為AI建構接口
也就是:AI需要一個「被設計過的世界」
這裡的核心問題是:軟體世界會不會為AI重建?
Anthropic的賭注是:
企業會逐步標準化介面
API與MCP會普及
生態系會重構
OpenAI的賭注是:
世界不會等你重建
所有現有UI都可以直接用
AI自己學會「操作世界」
這其實是兩種不同觀點:
Anthropic:長期協作演化
OpenAI:立即接管現實
如果從更底層來看,這場競爭其實已經不是AI模型之爭,而是:
誰能控制人類數位世界的操作層
過去:
軟體公司控制功能
API控制整合
使用者控制操作
現在開始變成:AI控制操作流程
這意味著:
SaaS不再是終點
API不再是必要
UI變成可被「直接駭入式使用」的介面
這也解釋了一個現象:企業軟體的護城河正在快速變薄。
如果把這個變化拉回台灣與亞洲企業,可以看到一個很清楚的結構性影響:
1️⃣ 高比例「無API系統」
很多企業仍依賴:
傳統ERP
本地部署系統
客製化內部工具
這正是AI最容易滲透的區域
2️⃣ IT自動化長期外包化
許多流程依賴:
人工操作
外包維護
半自動流程
AI代理會直接取代「操作人力層」
3️⃣ 製造業與營運流程高度碎片化
台灣製造業的數位工具常常是:
多系統拼接
手動資料轉換
非標準流程
這些正是Codex類型AI最強的場景
台灣不一定是AI模型競爭的中心,但會是「AI操作滲透率」最快的區域之一。
當Codex類型系統成熟後,工作型態會出現一個微妙轉變:
過去:
人 → 操作軟體
現在:
人 → 指揮AI → AI操作軟體
未來:
人 → 設定目標 → AI自動完成整個流程
這會導致一個新角色出現:
「不操作工具的人,而是設計任務的人」
Codex最具顛覆性的不是單一任務能力,而是:
多代理並行
背景運行
任務排程
自動恢復
這代表:工作不再是線性,而是「並行流動」
人類第一次不需要「等一個任務完成」。
當AI能操作所有UI之後,競爭將變成:
誰能控制最多系統
誰能最少人力完成最多流程
誰能把決策壓縮成最少指令
這也意味著一件事:
軟體產業的價值會從「功能設計」轉向「行動編排」
如果把這場變化拉到最底層,其實只有一個問題:
當AI可以使用所有軟體時,人類還需要「打開軟體」嗎?
這不是未來五年的問題,而是正在發生的問題。
Codex代表的不是一個產品,而是一個轉折點:
從模型競爭
到系統競爭
再到操作權競爭
下一階段的分界線會變得非常清楚:
一邊是需要人類操作的世界,一邊是AI自行運行的世界
而真正的分水嶺,正在螢幕之間悄悄發生。
以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!